کاربرد یادگیری تقویتی در یک مدل‌سازی عامل‌محور برای بازار عمده‌فروشی برق ایران

نویسندگان

سعید مشیری دانشیار گروه اقتصاد نظری، دانشگاه علامه طباطبائی

فرهاد فلاحی دانشجوی دکتری مهندسی برق قدرت، دانشگاه شاهد و پژوهشگر پژوهشگاه نیرو

محمدرضا اصغری اسکوئی گروه علوم رایانه، دانشکده علوم ریاضی و رایانه، دانشگاه علامه طباطبائی

میثم دوستی‌زاده استادیار دانشکده فنی و مهندسی دانشگاه لرستان

چکیده مقاله:

مطالعات اخیر بازارهای عمده‌فروشی برق عموماً براساس مدل‌های چندعاملی است، که در آن‌ها تعادل بازار برپایه رقابت و تعامل عوامل متعدد با یک دیگر به دست می‌آید. از ویژگی‌های اصلی این نوع مدل‌ها، امکان یادگیری عوامل از نتایج رفتار خود و سایرین دریک محیط رقابتی است. در بازار عمده‌فروشی برق، هرعامل یک واحد تولیدکننده برق است که به صورت مستقل و هوشمند با سایر عامل‌ها برای عرضه برق با قیمت‌های پیشنهادی رقابت می‌کند. فرآیند قیمت‌گذاری را می‌توان یک بازی ایستا فرض نمود که هرروز تکرار می‌شود. در این بازی هر عامل قیمت پیشنهادی خود را مستقلا اعلام نموده و بهره‌بردار با توجه به تقاضای بار مصرفی و محدودیت‌ها، بهترین پیشنهادها را انتخاب می‌نماید. عامل به صورت عقلائی عمل نموده و با انتخاب استراتژی مناسب، به دنبال بیشینه نمودن سود بلندمدت خود است. در این راستا، عامل از قدرت یادگیری و بهبود استراتژی قیمت‌گذاری، که نقش بسیار تعیین کننده در موفقیت عامل دارد، استفاده می‌کند. یادگیری تقویتی یک روش کلاسیک است که در مدل‌های چندعاملی امکان یادگیری مبتنی بر سعی و خطا را فراهم می‌نماید. هدف این مقاله کاربرد و مطالعه روش‌های یادگیری تقویتی در مدل چندعاملی بازار برق ایران و مقایسه آن‌ها با دو استراتژی تصادفی و حریصانه است. در این مطالعه، میزان سود واحدها و زمان رسیدن به حالت تعادل به عنوان ملاک ارزیابی در نظر گرفته شده است. نتایج شبیه سازی نشان می‌دهد، استراتژی یادگیرنده سود عامل‌ها را به طور معناداری افزایش می‌دهد و سرعت همگرائی به حالت تعادل را بیشتر می‌کند.

Download for Free

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

شبیه سازی چندعاملی بازار برق به کمک الگوریتم یادگیری تقویتی

چکیده ندارد.

15 صفحه اول

معرفی یک شبیه ساز عامل محور برای بازار برق

در یک بازار برق واقعی، اطلاعات کاملی از رفتار رقبا در اختیار شرکت کنندگان بازار قرار ندارد. بدین ترتیب شرکت کنندگان بازار، تصمیم گیری های خود را بر مبنای اطلاعات موجود از قیمت بازار در گذشته انجام می دهند. در این مقاله، یک شبیه ساز جدید برای بازارهای همزمان انرژی و ذخیره چرخان ارائه می گردد که در آن فرآیند کسب تجربه و یادگیری شرکت کنندگان بازار با استفاده از یک روش یادگیری تقویتی مدلسازی شده اس...

متن کامل

یک روش ترکیبی جدید یادگیری تقویتی فازی

در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه می‌شود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته می‌شود. هدف، یافتن مناسب‌ترین عمل نامزد (تالی) برای هر قاعده می‌باشد. با استفاده از بردار شدت آتش قواعد فازی و ...

متن کامل

روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...

متن کامل

شبیه‌سازی حراج پرداخت براساس پیشنهاد و حراج یکنواخت در بازار برق ایران: رهیافت الگوریتم تقویتی راث- ارو

طی سال‌های پس از تجدید ساختار صنعت برق یکی از مهم‌ترین چالشها، نوع حراج مورد استفاده در بازار برق تجدید ساختارشده بوده است. به صورت کلی، دو نوع حراج یکنواخت و پرداخت بر اساس پیشنهاد در بازارهای برق استفاده می‌شود. هدف از مطالعه حاضر، مقایسه حراج یکنواخت و حراج پرداخت بر اساس پیشنهاد با استفاده ار مدلسازی مبتنی بر عامل میباشد. بدین منظور، بر مبنای نظریههای اقتصاد و مدلسازی مبتنی بر عامل، با...

متن کامل

کاربرد روش یادگیری تقویتی برای تعیین دستورالعمل بهره‏برداری برحسب درخواست توزیع و تحویل بهینة آب

یکی از رویکردهای مؤثر تحویل و توزیع آب در شبکه‌های آبیاری روش برحسب درخواست است که با توجه به ساختار هر شبکه قابل اجراست؛ اما به استخراج دستورالعمل بهره‏‏برداری نیاز دارد. در این تحقیق، مدل تعیین دستورالعمل بهره‏برداری روش برحسب درخواست با الگوریتم یادگیری تقویتی سارسای فازی (FSL) توسعه داده شد و در کانال E1R1 شبکة آبیاری دز آزمون شد. ورودی این الگوریتم دبی‏های درخواست‏شده و خروجی آن دستورالعمل...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

عنوان ژورنال

اقتصاد انرژی ایران

دوره 7 شماره 25

صفحات 1- 40

تاریخ انتشار 2018-09-11

دنبال کردن

لغو دنبال کردن

{@ msg @}

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

مدل‌سازی عامل‌محور بازار برق یادگیری تقویتی نظریه بازی‌ها ایران

میزبانی شده توسط پلتفرم ابری doprax.com